
Rajinder Singh
Deep Learning Researcher

वेब ऑटोमेशन के लिए ऐसे उपकरण की आवश्यकता होती है जो शक्तिशाली और उपयोग में आसान हो। हालांकि, आधुनिक वेबसाइटें बहुत जटिल एंटी-बॉट मापदंड और कैप्चा का उपयोग करती हैं जो ऑटोमेशन स्क्रिप्ट को रोक सकते हैं।
हेलियम और कैपसॉल्वर के संयोजन एक शीर्ष उत्तर प्रदान करता हैं:
इन उपकरणों के साथ, आसान वेब ऑटोमेशन संभव होता है जो कैप्चा चुनौतियों को स्वचालित रूप से हल करता है।
इस गाइड आपको तीन मुख्य लक्ष्य प्राप्त करने में मदद करेगा:
हेलियम एक पायथन प per है जो सेलेनियम के उपयोग को आसान बनाता है। यह एक उच्च स्तर के API प्रदान करता है जो आम भाषा में ब्राउजर ऑटोमेशन लिखने की अनुमति देता है।
click("Submit") लिखेंwrite("Hello", into="Search")# हेलियम स्थापित करें
pip install helium
# कैपसॉल्वर API के लिए requests प per स्थापित करें
pip install requests
from helium import *
# ब्राउजर शुरू करें और नेविगेट करें
start_chrome("https://wikipedia.org")
# खोज बॉक्स में टाइप करें
write("Python programming", into=S("input[name='search']"))
# खोज बटन पर क्लिक करें
click(Button("Search"))
# यदि पाठ मौजूद है तो जांचें
if Text("Python").exists():
print("Python लेख पाया गया!")
# ब्राउजर बंद करें
kill_browser()
कैपसॉल्वर एक AI-आधारित स्वचालित कैप्चा हल करने वाली सेवा है जो विस्तृत कैप्चा प्रकारों का समर्थन करती है। यह एक सरल API प्रदान करता है जो आपको कैप्चा चुनौतियां जमा करने और केकंड में हल्यूशन प्राप्त करने की अनुमति देता है।
बोनस: पंजीकरण के समय कोड
HELIUMका उपयोग करें ताकि बोनस क्रेडिट प्राप्त हो सके!
https://api.capsolver.comhttps://api-stable.capsolver.comहेलियम के साथ कैपसॉल्वर के संयोजन से पहले, वेब ऑटोमेशन कई चुनौतियों का सामना करता रहा है:
| चुनौति | प्रभाव |
|---|---|
| कैप्चा चुनौतियां | हस्तचालित हल करने की आवश्यकता होती है, ऑटोमेशन तोड़ देता है |
| जटिल चयनकर्ता | सेलेनियम को विस्तृत XPath/सैसी सेलेक्टर की आवश्यकता होती है |
| समय समस्याएं | तत्व जब तक उपलब्ध नहीं होते तब तक उपयोग नहीं किया जा सकता |
| कोड पठनीयता | ऑटोमेशन स्क्रिप्ट को बनाए रखना कठिन होता है |
हेलियम + कैपसॉल्वर एकीकरण इन चुनौतियों को स्पष्ट, पठनीय कोड के साथ हल करता है।
API एकीकरण दृष्टिकोण आपको कैप्चा हल करने प्रक्रिया पर पूर्ण नियंत्रण प्रदान करता है और किसी भी कैप्चा प्रकार के साथ काम करता है।
pip install helium requests
import time
import requests
from helium import *
CAPSOLVER_API_KEY = "आपका एपीआई कुंजी"
CAPSOLVER_API = "https://api.capsolver.com"
def create_task(task_payload: dict) -> str:
"""कैप्चा हल करने के कार्य को बनाएं और कार्य पहचान लौटाएं।"""
response = requests.post(
f"{CAPSOLVER_API}/createTask",
json={
"clientKey": CAPSOLVER_API_KEY,
"task": task_payload
}
)
result = response.json()
if result.get("errorId") != 0:
raise Exception(f"कैपसॉल्वर त्रुटि: {result.get('errorDescription')}")
return result["taskId"]
def get_task_result(task_id: str, max_attempts: int = 120) -> dict:
"""कार्य परिणाम के

## 1. परिचय
वेब ऑटोमेशन के लिए ऐसे उपकरण की आवश्यकता होती है जो शक्तिशाली और उपयोग में आसान हो। हालांकि, आधुनिक वेबसाइटें बहुत जटिल एंटी-बॉट मापदंड और कैप्चा का उपयोग करती हैं जो ऑटोमेशन स्क्रिप्ट को रोक सकते हैं।
**हेलियम** और **कैपसॉल्वर** के संयोजन एक शीर्ष उत्तर प्रदान करते हैं:
- **हेलियम**: सेलेनियम के साथ आसान उपयोग के लिए एक हल्का पायथन पुस्तकालय जो एक सरल, मानव-पठनीय API प्रदान करता है
- **कैपसॉल्वर**: क्लाउडफ़ेयर टर्नस्टाइल, रीकैप्चा आदि जैसे अधिक कैप्चा के समाधान के लिए एआई-आधारित कैप्चा हल करने वाली सेवा
इन उपकरणों के साथ, आसान वेब ऑटोमेशन संभव होता है जो कैप्चा चुनौतियों को स्वचालित रूप से हल करता है।
### 1.1. एकीकरण लक्ष्य
इस गाइड आपको तीन मुख्य लक्ष्य प्राप्त करने में मदद करेगा:
1. **ब्राउजर ऑटोमेशन सरल करें** - स्पष्ट, पठनीय कोड के लिए हेलियम के संगत API का उपयोग करें
2. **कैप्चा स्वचालित रूप से हल करें** - कैपसॉल्वर के API के साथ एकीकृत करें ताकि कैप्चा चुनौतियों को हस्तचालित बिना हल किया जा सके
3. **लचीलापन बनाए रखें** - आवश्यकता पड़ने पर सेलेनियम की पूरी शक्ति के लिए पहुंच प्राप्त करें जबकि कोड सरल रहता है
## 2. हेलियम क्या है?
[हेलियम](https://github.com/mherrmann/helium) एक पायथन पुस्तकालय है जो सेलेनियम के उपयोग को आसान बनाता है। यह एक उच्च स्तर के API प्रदान करता है जो आम भाषा में ब्राउजर ऑटोमेशन लिखने की अनुमति देता है।
### 2.1. मुख्य विशेषताएं
- **सरल सिंटैक्स** - जटिल XPath चयनकर्ता के बजाय `click("Submit")` लिखें
- **ऑटो-वाइटिंग** - तत्व उपलब्ध होने तक स्वतः प्रतीक्षा करें
- **मानव-पठनीय** - कोड निर्देशों के तरह पढ़ें: `write("Hello", into="Search")`
- **सेलेनियम संगत** - आवश्यकता पड़ने पर बेसिक सेलेनियम ड्राइवर तक पहुंच प्राप्त करें
- **हल्का** - सेलेनियम पर न्यूनतम ओवरहेड
### 2.2. स्थापना
```bash
# हेलियम स्थापित करें
pip install helium
# कैपसॉल्वर API के लिए requests पुस्तकालय स्थापित करें
pip install requests
from helium import *
# ब्राउजर शुरू करें और नेविगेट करें
start_chrome("https://wikipedia.org")
# खोज बॉक्स में टाइप करें
write("Python programming", into=S("input[name='search']"))
# खोज बटन पर क्लिक करें
click(Button("Search"))
# यदि पाठ मौजूद है तो जांचें
if Text("Python").exists():
print("Python लेख पाया गया!")
# ब्राउजर बंद करें
kill_browser()
कैपसॉल्वर एक AI-आधारित स्वचालित कैप्चा हल करने वाली सेवा है जो विस्तृत कैप्चा प्रकारों का समर्थन करती है। यह एक सरल API प्रदान करता है जो आपको कैप्चा चुनौतियां जमा करने और सेकंड में हल्यूशन प्राप्त करने की अनुमति देता है।
बोनस: पंजीकरण के समय कोड
HELIUMका उपयोग करें ताकि बोनस क्रेडिट प्राप्त हो सके!
https://api.capsolver.comhttps://api-stable.capsolver.comहेलियम के साथ कैपसॉल्वर के संयोजन से पहले, वेब ऑटोमेशन कई चुनौतियों का सामना करता रहा है:
| चुनौति | प्रभाव |
|---|---|
| कैप्चा चुनौतियां | हस्तचालित हल करने की आवश्यकता होती है, ऑटोमेशन तोड़ देता है |
| जटिल चयनकर्ता | सेलेनियम को विस्तृत XPath/कैसी सेलेक्टर की आवश्यकता होती है |
| समय समस्याएं | तत्व जब तक उपलब्ध नहीं होते तब तक उपयोग नहीं किया जा सकता |
| कोड पठनीयता | ऑटोमेशन स्क्रिप्ट को बनाए रखना कठिन होता है |
हेलियम + कैपसॉल्वर एकीकरण इन चुनौतियों को स्पष्ट, पठनीय कोड के साथ हल करता है।
API एकीकरण दृष्टिकोण आपको कैप्चा हल करने प्रक्रिया पर पूर्ण नियंत्रण प्रदान करता है और किसी भी कैप्चा प्रकार के साथ काम करता है।
pip install helium requests
import time
import requests
from helium import *
CAPSOLVER_API_KEY = "आपका एपीआई कुंजी"
CAPSOLVER_API = "https://api.capsolver.com"
def create_task(task_payload: dict) -> str:
"""कैप्चा हल करने के कार्य को बनाएं और कार्य पहचान लौटाएं।"""
response = requests.post(
f"{CAPSOLVER_API}/createTask",
json={
"clientKey": CAPSOLVER_API_KEY,
"task": task_payload
}
)
result = response.json()
if result.get("errorId") != 0:
raise Exception(f"कैपसॉल्वर त्रुटि: {result.get('errorDescription')}")
return result["taskId"]
def get_task_result(task_id: str, max_attempts: int = 120) -> dict:
"""कार्य परिणाम के लिए पॉल करें जब तक कि हल न हो या समय सीमा समाप्त न हो।"""
for _ in range(max_attempts):
response = requests.post(
f"{CAPSOLVER_API}/getTaskResult",
json={
"clientKey": CAPSOLVER_API_KEY,
"taskId": task_id
}
)
result = response.json()
if result.get("status") == "ready":
return result["solution"]
elif result.get("status") == "failed":
raise Exception(f"कार्य विफल: {result.get('errorDescription')}")
time.sleep(1)
raise TimeoutError("कैप्चा हल करने में समय सीमा समाप्त हो गई")
def solve_captcha(task_payload: dict) -> dict:
"""पूर्ण कैप्चा हल करने की प्रक्रिया।"""
task_id = create_task(task_payload)
return get_task_result(task_id)
आप हेलियम के साथ कैपसॉल्वर ब्राउजर एक्सटेंशन का उपयोग भी कर सकते हैं जो स्वचालित कैप्चा निर्
responseField.value = '{token}';
}}
// Call callback if exists
if (typeof onRecaptchaSuccess === 'function') {{
onRecaptchaSuccess('{token}');
}}
''')
print("reCAPTCHA v3 bypassed!")
finally:
kill_browser()
if name == "main":
main()
## 7. शीर्ष व्यवहार
### 7.1. ब्राउजर की समायोजन
सामान्य ब्राउजर के रूप में च्रोम को कॉन्फ़िगर करें:
```python
from helium import *
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation'])
options.add_experimental_option('useAutomationExtension', False)
options.add_argument('--disable-blink-features=AutomationControlled')
options.add_argument('--window-size=1920,1080')
start_chrome(options=options)
अधिकांश ऑपरेशन के लिए हेलियम के सरल सिंटैक्स का उपयोग करें, लेकिन आवश्यकता होने पर सेलेनियम का उपयोग करें:
from helium import *
start_chrome("https://target-site.com")
# हेलियम के साथ सरल अंतःक्रियाएं करें
write("username", into="Email")
write("password", into="Password")
# जटिल ऑपरेशन के लिए सेलेनियम ड्राइवर का उपयोग करें
driver = get_driver()
driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")
# हेलियम पर वापस आएं
click("Login")
यादृच्छिक देरी जोड़कर दर सीमा को बचाएं:
import random
import time
def human_delay(min_sec=1.0, max_sec=3.0):
"""मानव व्यवहार के अनुकरण के लिए यादृच्छिक देरी।"""
time.sleep(random.uniform(min_sec, max_sec))
# कार्यों के बीच उपयोग करें
click("Next")
human_delay()
write("data", into="Input")
CAPTCHA हल करते समय उचित त्रुटि संभाल के लिए लिखें:
def solve_with_retry(task_payload: dict, max_retries: int = 3) -> dict:
"""पुन: प्रयास ताकत के साथ CAPTCHA हल करें।"""
for attempt in range(max_retries):
try:
return solve_captcha(task_payload)
except TimeoutError:
if attempt < max_retries - 1:
print(f"समय सीमा पार हो गई, पुन: प्रयास कर रहे हैं... ({attempt + 1}/{max_retries})")
time.sleep(5)
else:
raise
except Exception as e:
if "balance" in str(e).lower():
raise # बैलेंस त्रुटि के लिए पुन: प्रयास न करें
if attempt < max_retries - 1:
time.sleep(2)
else:
raise
पृष्ठभूमि ऑटोमेशन के लिए हेडलेस मोड का उपयोग करें:
from helium import *
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
start_chrome("https://target-site.com", options=options)
| कार्य | सेलेनियम | हेलियम |
|---|---|---|
| बटन क्लिक करें | driver.find_element(By.XPATH, "//button[text()='Submit']").click() |
click("Submit") |
| टेक्स्ट टाइप करें | driver.find_element(By.NAME, "email").send_keys("test@test.com") |
write("test@test.com", into="Email") |
| एंटर दबाएं | element.send_keys(Keys.ENTER) |
press(ENTER) |
| टेक्स्ट मौजूद है | "Welcome" in driver.page_source |
Text("Welcome").exists() |
हेलियम और CapSolver के एकीकरण से वेब ऑटोमेशन के लिए एक शिखर उपकरण बनता है:
क्या आप वेब स्क्रैपर, ऑटोमेटेड परीक्षण प्रणाली या डेटा एकत्रीकरण पाइपलाइन बना रहे हैं, इस संयोजन के साथ आसानी से काम कर सकते हैं।
अतिरिक्त बोनस: CapSolver पर पंजीकरण करते समय कोड
HELIUMका उपयोग करें ताकि बोनस क्रेडिट प्राप्त करें!
हेलियम सेलेनियम को आसान बनाता है:
CapSolver सभी प्रमुख CAPTCHA प्रकारों का समर्थन करता है। Cloudflare Turnstile और reCAPTCHA v2/v3 के सबसे उच्च सफलता दर हैं। एकीकरण के साथ कोई भी CAPTCHA जो CapSolver समर्थित है, बिना किसी बाधा के काम करता है।
हां! हेलियम हेडलेस मोड के साथ समर्थित है। reCAPTCHA v3 और टोकन-आधारित CAPTCHA के लिए हेडलेस मोड पूरी तरह से काम करता है। v2 दृश्य CAPTCHA के लिए, हेडेड मोड बेहतर परिणाम प्रदान कर सकता है।
पेज सोर्स में देखें:
data-sitekey विशेषता या cf-turnstile तत्वg-recaptcha डिव पर data-sitekey विशेषताआम समाधान:
हां! get_driver() कॉल करें ताकि अंतर्निहित सेलेनियम वेब ड्राइवर का उपयोग करें जब आवश्यकता हो।
Rust में वेब स्क्रैपिंग के स्केलेबल आर्किटेक्चर सीखें, reqwest, scraper, असिंक्रोनस स्क्रैपिंग, हेडलेस ब्राउज़र स्क्रैपिंग, प्रॉक्सी रोटेशन, और संगत CAPTCHA का निपटारा।

CapSolver के साथ RoxyBrowser के एकीकरण करें ताकि ब्राउज़र के कार्यों को स्वचालित किया जा सके और reCAPTCHA, Turnstile और अन्य CAPTCHAs को बायपास किया जा सके।
